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Mierniki asymetrii i skośności 


` The Measures of Asymmetry and Skewness 


Mierniki asymetrii i skośności, które proponuje się w dalszej części pracy służą 
do badania tych dwóch cech rozkładów liczebności w szeregach statystycznych. 
Należy wyraźnie podkreślić, że terminów asymetria i skośność nie można używać 
zamiennie. Uzasadnienie dla wyraźnego rozróżnienia asymetrii i skośności można 
znaleźć w pracy S. Forlicza.! 

W procesie formułowania mierników asymetrii i skośności będą uwzględnione 
następujące określenia: 

Określenie 1: 

Zmienna losowa ma rozkład skośny, jeżeli jej średnia i dominanta nie są sobie równe, 
tj. jeśli 


m # D (1) 
Warunek (1) nie zachodzi, jesli m = D, co oznacza, ze w takim przypadku rozklad 
nie jest skośny. Nie oznacza to jednak, że jest symetryczny.? 
Określenie 2: 
Zmienna losowa X ma rozkład prawdopodobieństwa symetryczny, jeżeli istnieje 
taki punkt a, ze dla każdej wartości z tej zmiennej spełniona jest równość:3 


P(X <a—z)=P(X >a+z), (2) 


Określenia (1) i (2) są wiążące dla procesu budowy proponowanych niżej 
mierników, przy czym, rzecz jasna, zachowując istotę tych określeń, będzie się 
budować te mierniki, wykorzystując liczebności w szeregu statystycznym. 

1 S. Forlicz: Asymetria e skośność, „Przeg. Statyst.”, 1986, 1. 


2 Ibidem. 
3 Mała Encyklopedia Statystyki, PWE, Warszawa 1976, s.603. 
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Dla sformułowania mierników asymetrii i skośności w szeregach statystycznych 
należy sprecyzować wielkość a z równości (2). Niech tę wielkość reprezentują a, = D 
iaz = 0, 5(£mar~ Tmin). Przy czym dla sformułowania miernika skośności przyjmuje 
się, rzecz jasna, ay = D. 

Do mierzenia asymetrii w pracach z zakresu statystyki poleca się najczęściej 
następujące mierniki: 


m~ D 


W; = = (3) 

W, = 5 (4) 
_(Qs—-M)-(M-Q:) 

ma Qa = Qı | (5) 


gdzie: 

m — średnia zmiennej losowej, 

D — dominanta, 

u3 — moment centralny trzeciego rzędu, 

a — odchylenie standardowe, 

M -— mediana, 

Qı i Q3 — kwartyle pierwszy i trzeci. 

Mierniki (3), (4) i (5) polecane są do mierzenia asymetrii”. Stefan Forlicz 
pokazuje w swojej pracy,” że mierniki (3) — (5) nie są dobrymi miernikami asymetrii. 

Mierniki (3) — (5) nie są też dobrymi miernikami skośności. Jedynie miernik Wy 
związany jest bezpośrednio z określeniem skośności, nie jest on jednak unormowany. 
J. Wywiał przedstawił procedurę normowania miernika W2, nie oznacza to jednak, 
że jest to dobry miernik asymetrii, gdyż możliwe jest wystąpienie równości W3 = 0 
dla asymetrycznego rozkładu zmiennej losowej. Miernik W3 jest unormowany. 


MIERNIKI ASYMETRII W SZEREGACH STATYSTYCZNYCH 
ROZDZIELCZYCH I SZCZEGÓŁOWYCH WAŻONYCH 


Formułując mierniki asymetrii przyjmuje się na wstępie dwa założenia. 
Założenie 1: 
Szereg rodzielczy zawiera k przedziałów o identycznej rozpiętości każdy i li- 
czebnościach n;(i = 1,2,...,k). 
Założenie 2: 


4 Zob.M.Krzysztofiak, A.Luszniewicz: Statystyka, PWE, Warszawa 1976, s. 141-144; 
M. Krzysztofiak, D. Urbanek: Metody Statystyczne. PWN, Warszawa 1975; s.195—197; 
B. Szulc: Statystyka dla ekonomistów, t.1, Opis statystyczny, PWE, Warszawa 1972, s. 240-249; 
K. Zając: Zarys metod statystyczny, PWE, Warszawa 1974, s.225-227. 

5 Forlicz: op. cit. 

6 Ibidem. 
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Szereg szczegółowy ważony zawiera wartości zmiennej 1,,zą,..., rk 1 odpowiednio 
liczebności n;(i = 1,2,...,k), przy czym różnica z, — zi- = h dla ¿ = 2,3,...,k, 
gdzie h — stała. 

Niech najpierw mierniki asymetrii uwzględniają założenie, że osią symetrii jest 
prosta równoległa do osi rzędnych przechodząca przez punkt dominanty (czyli 
zakłada się, ze a, = D). 

Jeżeli istnieje jedna wartość zmiennej skokowej lub jeden przedział najliczniejszy, 
to miernik asymetrii (M AS1) proponuje się określać następująco: 


M 
E (6) 
gdzie: n; — maksymalna liczebność w szeregu, M — suma liczebności calego 


szeregu. 
Jeśli występują dwa przedziały lub dwie wartości najliczniejsze, to 


MAS = 


Nt 


MAS, = ——-—— 
f N — nj — ny41 


(7) 
gdzie: nj = nj41 to dwie maksymalne liczebności dla dwóch kolejnych przedziałów 
lub dwóch kolejnych wartości zmiennej. 

Wielkość N, obliczana jest dla szeregu z jednym maksimum liczebności według 
wzoru: 


A 
Ni = È Inju- nj-il, (8) 
i=1 
gdzie: r = maz{(j — 1), (k — j)). 
" Dla dwóch maksymalnych liczebności w szeregu (nj = nj41) liczebność NÍ 
oblicza się według wzoru: 


r 
Ni = Do Inisi — nj-il, (9) 
I=1 


gdzie: r = maz((j — 1), (k — j — 1)). 

Miernik podany wzorem (6) sformułowany został przez S. Forlicza” do mierzenia 
asymetrii w szeregach rozdzielczych z jednym przedziałem najliczniejszym, a dla 
szeregów z dwoma najliczniejszymi przedziałami autor ten zaproponował (w notacji 
przyjętej w niniejszej pracy): r 


+ 
MAS = a (10) 


Wydaje się, że rozwiązanie (7) jest lepsze niż rozwiązanie (10). Uzasadnienie tej 
gradacji wynika z „zachowania się” tych mierników w przykładzie 1 i w przykła- 
dzie 1’. 


T Ibidem. 
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Przykład 1 Przykład 1’ 


Analiza wzorów (7) i (10) wykazuje, że wartość miernika M AS zależy, przy tych 
samych wartościach Nj, od sumy liczebności dwóch przedziałów najliczniejszych. 
Typ tej zależności pokazuje przykład 1, dla którego otrzymano: MASy(a) = 0,6, 
M AS, (b) = 0,6, M AS(a) = 0, 12, M AS(b) = 0, 24. Wartości miernika M AS zależą 
od smukłości rozkładu. Poza tym miernik MAS nie może przyjmować skrajnej 
wartości I, jeśli asymetria względem dominanty jest skrajna, a więc wtedy gdy 
dwie największe liczebności znajdują się bądź na początku obszaru zmienności, 
bądź na końcu. Dodatkowo należy zauważyć, że stabilność miernika MAS jest 
mniejsza niż miernika MAS, bowiem jeśli rozkład danej zmiennej ujmiemy w 
dwa różne szeregi rozdzielcze, pierwszy o krótkich przedziałach, a drugi o długich 
przedziałach i jeśli pierwszy będzie posiadał dwa najliczniejsze przedziały, a drugi 
jeden, to otrzymamy dwie różne oceny asymetrii przy pomocy mierników MAS, i 
M AS. To zagadnienie ilustrują wartości mierników M AS; i MAS, obliczonymi dla 
przykładu 1’, utworzonego z przykładu 1 przez podwojenie długości przedziałów. 
Wartości mierników M AS; obliczone z wzoru (6) dla przykładu 1’ są następujące: 
M A$;(a) = MAS;(b) = 0,6. Przy czym dla przykładu 1 otrzymano: MAS;(a) = 
MAS,(b) = 0,6, M AS(a) = 0,12, MAS(b) = 0,24. Można zatem w konsekwencji 
stwierdzić, że miernik M AS, jst stabilny. 

Badając symetrię rozkładu, można ją określić względem punktu a = 0, 5(£maz — 
Zmin), czyli względem wartości położonej na środku obszaru zmienności danej 
zmiennej. Zatem przyjmując w dalszym ciągu założenia (1) i (2) poczynione na 
wstępie tego punktu można określić miernik asymetrii MAS. 

Jeśli liczba k, czyli liczba przedziałów wartości lub wartości zmiennej jest 
parzysta, to 


No 
MAS; = W" (11) 
dla k nieparzystego jest 
= ` N3 
MAS) = ra (12) 


gdzie: 


Mierniki asymetrii i skośności 325 


s 
No = J |nr+t — mesial, (13) 
t=1 
j-1 
N; = So Inj- ja, (14) 
1=1 


przy czym: 

N — liczebność całej zbiorowości, 

nj — liczebność środkowego przedziału lub środkowej wartości, 

Ny inp41 — to dwie liczebności środkowych przedziałów wartości lub środkowych 
wartości, 

r = 0, 5k, 

j = 0,5(k + 1). 

Mierniki M AS; i M AŚ? przyjmują wartości z przedziału [0, 1]. W przypadku 
symetrii przyjmują wartość 0, a w przypadku skrajnej asymetrii wartość 1. Kon- 
strukcja miernika M AS} w podstawowych założeniach jest podobna do miernika 
asymetrii przedstawionego przez J. Steczkowskiego.$ 


MIERNIKI SKOŚNOŚCI W SZEREGACH STATYSTYCZNYCH 
ROZDZIELCZYCH I SZCZEGÓŁOWYCH WAŻONYCH 


Wiadomo, że symetryczny rozkład zmiennej losowej posiadającej dominantę nie 
jest skośny, natomiast rozkład zmiennej losowej nie skośny może być asymetryczny.” 

Należy oczekiwać, że zastępując zwykłymi nawiasami operator bezwzględnej 
wartości we wzorach (8) i (9) otrzymuje się podstawę do sformułowania miernika 
skośności (M SK), przy spełnieniu sformułowanych w tej pracy założeń (1) i (2). 
Mianowicie: 


N3 
MSK = (15) 


N3 


MSK = _——RB—,, 
N — nj ~nj41 


(16) 
przy czym znaczenie symboli N, nj, nj+41 jest takie, jak we wzorach (8) i (9). 

Wzór (15) służy do mierzenia skośności, gdy istnieje jeden przedział najliczniej- 
szy lub jedna wartość najliczniejsza, to jest gdy n; = maz(n,), dla i = 1,2,...,k 
i w tym przypadku oblicza się 


N3 = X (njn —nj-1), — (17) 
i= 


8 J. Steczkowski: Statystyczna procedura określania struktury zbiorowości. „Zesz. Nauk.” 
WSE w Krakowie, 1970, 21. 
9 Forlicz: op. cit. 
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gdzie: r = maz((j — 1),(k — 3)). 

Wzór (16) służy do obliczania miernika skośności w przypadku występowania 
dwóch kolejnych największych liczebności, to jest gdy nj = nj41 = maz(n;), dla 
1=1,2,...,k i w tym przypadku oblicza sie 


r . 
N3 = J (njiya — 5-1); (18) 

iz1 

gdzie: r = mazf(j — 1), (k — j — 1)). 

Zaletą mierników skośności (15) i (16) jest ich unormowanie w przedziale [-1, 1]. 
Niestety nierówność MSK < 0 nie implikuje nierówności m < D oraz nierówność 
MSK >0 nie implikuje nierówności m > D, ani równość MSK =0 nie implikuje 
równości m = D. Można stwierdzić jedynie, że w przypadku jednego maksimum 
liczebności wymienione trzy implikacje bardzo często pojawiają się, niestety nie 
zawsze. Jest to w głównej mierze konsekwencją malej stabilności średniej.!9 

Wydaje się, że miernik M SK jest równie „dobrym” („niedobrym” ) miernikiem 
skośności, jak mierniki Wą, W2, W3. 

Możliwe jest określenie unormowanego miernika skośności zgodnego w swo- 
jej istocie z definicją skośności (określenie 1). Niech zatem szeregi statystyczne 
spełniają założenia (1) i (2), poczynione na wstępie punktu drugiego. Uwzględniając 
„mechanizm oddalajacy” wartość średnią od dominanty, proponuje się miernik 
skośności M SK. 

Miernik MSK, dla szeregów statystycznych z jednym przedziałem najliczniej- 
szym lub jedną wartością najliczniejszą określony jest następująco: 


MSK, = Ziel. MZ Że BE, (19) 
Der PA nja + Th nji 


gdzie: 

nj = maz(ni,N2,..., Nz), czyli nj jest maksymalną liczebnością, 

k — liczba wartości zmiennej (przedziałów) w szeregu statystycznym, 

h — stała rozpiętość przedziałów lub stała wartość różnicy z; — z;_; w szeregu 
szczegółowym ważonym, 

r = maz{(k — j), (j — 1)). 

Jeśli nj = njy41 = maz(ni,na,..., nę), to znaczy jeśli istnieją dwa najliczniejsze 
przedziały lub dwie najliczniejsze wartości w szeregach statystycznych, to miernik 
MSK; określony jest następująco: 


MSK, 4 Pi- lh Nj+i+ — Dii lh nj- (20) 
Diz lh nja t Pim hnj 


gdzie: r = maz{(k — j — 1), (j — 1)}, a pozostałe symbole mają znaczenie takie, jak 
we wzorze (19). : 


10 F. Mostler, J.W. Tukey: Data Analysis and Regression (ed. rosyjska) „Finansy i Stati- 
stika”, Moskwa 1982, s. 205. 
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Miernik skośności M SK; można obliczyć także w przypadku uchylenia założeń 
(1) i (2), dotyczących cech szeregów statystycznych. Niech zatem przedziały sze- 
regu rozdzielczego będą różnej długości, wówczas w przypadku jednego prze- 
działu pretendującego do zawierania dominanty, miernik MSA, określony jest 
następująco: 


MSK, = Drei (2(9) 541 — 1(9);)n;41 — Lipi (2(4)j — a(d) -nji (21) 
Dien (2(9) — 2(9);)n; pi + Vier (2(d)j — ald) -nji 
gdzie: 

z(g) — górny kres przedziału, 

z(d) — dolny kres przedziału, 

n; — liczebność przedziału dominanty, 

r = maz{(k — j),(j — 1). 

Opisując znaczenie symboli we wzorze (21) użyto określenia liczebność prze- 
działu dominanty dla symbolu nj. Uczyniono tak dlatego, że dominanta w przy- 
padku różnych długości przedziałów w szeregu rozdzielczym położona jest nie za- 
wsze w przedziale najliczniejszym. Jest ona położona w takich przypadkach w prze- 
dziale j, w którym 


7 = maz (| (f=1,2,...,k), (22) 


gdzie n;, to liczebności przedziałów, a h;, to rozpiętości przedziałów. 

Dominanta jest położona zawsze w tym przedziale, w którym na jednostkę 
długości przedziału „przypada najwięcej liczebności”. Zatem w tym przedziale 
wartości zmiennej pojawiają się najczęściej (najgęściej). 

Może zdarzyć się, że w szeregu rozdzielczym o różnych długościach przedziałów 
dwa przedziały pretendują do zawierania dominanty, występuje to, jeśli 


Fi = Hitt = maz {Ti} (i= 1,2,...,k). (23) 
h;  hj4ı 


Zatem jeśli zaistnieje przypadek (23), to miernik MSK, dany jest wzorem: 


MSK, = Dotan (2(9)54141 — l) — Dotan (2(4)j — z(d);-r)nj ni 
= or r , 
Żi=1(7(9)5+141 — Z(9)j +1); +D (z(d); — 2(d)j-1) 5-1 
gdzie symbole z(g) i z(d) zachowują znaczenie z wzoru (21), r = maz((k — j — 
1), (j -= 1)}. 
Jeżeli w szeregu szczegółowym ważonym różnica z; — z;_1 £ h(i=2,3,...,k;h 
— stała), to M SKy, przy jednej liczebności maksymalnej (nj), oblicza się ze wzoru: 


(24) 


r > a P aj ża r = g > 
MSK, = Halin = zinin — Vier (45 jadna (25) 
Detar (254 — zj)njy + Prey (Tj — zji) 
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gdzie: 

z — wartości zmiennej skokowej odpowiednio indeksowane, 

n — liczebności odpowiednio indeksowane, 

r = maz((k — j) (j — 1)). 

Przy dwóch liczebnościach (nj = n;4+ ) maksymalnych, wzór na miernik MSKy 
w szeregu szczegółowym przyjmuje następującą postać: 


o zy leyerge— Zj+n)0 41H! — Der (25 — 25-1) 5-1 
MSK; = ELTH T Tjin — bala (Z Ti-UNS=I | (og) 
Ziza(Ti+1+1 — Zi+)Nj+1+1 + zy (Ej — 25-1) 07-1 


gdzie: r = mazf(j — 1), (k — j — 1)), pozostałe symbole mają znaczenie takie, jak 
we wzorze (25). 


WNIOSKI 


Proponowany miernik asymetrii MAS, mierzący asymetrię względem domi- 
nanty wykazuje własności dobrego miernika: 

a) jest unormowany w przedziale (0, 1], 

b) jest stabilny przy zmienającej się smukłości rozkładu, 

c) jest stabilny przy podziale obszaru zmienności na różnej długości przedziały 
(por. wyniki w tablicy 1 dotyczące przykładów la, 1b, 1’a, 1’b). 

Miernik MAS mierzy asymetrię względem wartości a2, leżącej na środku 
obszaru zmienności zmiennej. W związku z tym niektóre jego wlasności różnią się 
od własności miernika M AS,. Mianowicie miernik MAS»: 

a) jest unormowany w przedziale (0, 1], 

b) jego wartości zależą od smukłości rozkładu (z wyjątkiem przypadku, gdy 
dominanta „leży” na środku obszaru zmienności, czyli gdy D = a2), 

c) jest stabilny przy zmiennym podziale obszaru zmienności na przedziały. 

Miernik asymetrii M AS w warunkach skrajnej skośności może tylko nieznacz- 
nie różnić się od zera (por. wyniki w tab. 1 dotyczące przykładu 2c). Natomiast 
wartości miernika M AS; są mocniej związane z bezwzględną wartością mierników 
skośności. 

Do mierzenia skośności najbardziej przydatny jest miernik M SK, określony dla 
różnych wariantów szeregów statystycznych wzorami: (19), (20), (21), (24), (25), 
(26). Do zalet ‘tego miernika można zaliczyć: 

a) unormowanie obszaru zmienności do przedziału [-1, 1], 

b) wszechstronność, gdyż może być stosowany w szeregach rozdzielczych i szcze- 
gółowych ważonych, nadto rozdzielcze niekoniecznie muszą mieć przedziały tej 
samej długości, a szczegółowe ważone szeregi niekoniecznie muszą mieć stałe różnice 
między kolejnymi wartościami zmiennej (z£; — £;—1), 

c) stabilność wzgłędem podziału obszaru zmienności zmiennej na różnej długości 
przedziały w szeregu rozdzielczym, 

d) zbieżność jego istoty z różnicą m — D, określającą skośność. 
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Miernik skośności M SK jest, podobnie jak miernik MSKy, unormowany i sta- 
bilny, ale jest on znacznie słabiej związany z różnicą m — D, dlatego może być 
zawodny (por. wartości tego miernika w tablicy 1 dla przykładów 2a i 4b). 

Istnieją podstawy do twierdzenia, że mierniki asymetrii AJ AS, i M AŚ» oraz 
miernik skośności M SK; dobrze oceniają badane własności szeregów rozdzielczych 
i szczegółowych ważonych. Można zatem te mierniki wykorzystywać do efektywnego 
badania asymetrii i skośności. Należy jednak dodać, że w przypadku rozdzielczych 
szeregów statystycznych oceny asymetrii i skośności zawsze są przybliżone, po- 
nieważ szeregi rozdzielcze w mniejszym lub większym stopniu zacierają (deformuja) 
szczegółowy rozkład liczebności. Jednak zawsze dokładność oceny skośności przy 
pomocy miernika MSK, jest wyższa niż przy zastosowaniu mierników: Wi, Wo, 
W3. 


PRZYKŁADY ROZKŁADÓW LICZEBNOŚCI 
W SZEREGACH SZCZEGÓŁOWYCH WAŻONYCH I W SZEREGACH ROZDZIELCZYCH 


Zamieszczone w niniejszym punkcie przykłady służą do ilustracji wcześniej 
wymienionych własności mierników asymetrii i skośności. 
Końcowe obliczenia dotyczące wszystkich przykładów zamieszczono w tab. 1. 


Przykład 2 Przykład 3 Przykład 4 
EMKIOBKZOHKACH Lei | nfo) | nb) | BEWIKZONENONENCH 


Wyniki obliczeń zawarte w tab. 1 pozwalają dostrzec, że polecany w literatu- 
rze przedmiotu jako podstawowy miernik skośności W, jest zawodny. Rozkład li- 
czebności w przykładach 3b, 4c, 5b, 6b jest skrajnie skośny. Miernik Wy w każdym 
z tych przypadków nie daje podstawy do takiej oceny. 


Wartości miernika W; zawarte w pierwszych czterech wierszach pokazują jego 
zależność od wyboru długości przedziału w szeregu rozdzielczym. 
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Tab. 1. Zestawienie wyników obliczeń mierników asymetrii i skośności dla przykładów szeregów 
statystycznych, w nawiasach podano numery wzorów zastosowanych do obliczeń 


A comparison of the results of calculating the measurements of asymetry and skewness for the 
examples of statistical rows, the figures in parentheses stand for the numbers of expressions used 
for calculations 


Numer | Średnia | Domi- | Odchyl. MAS, MAS; MSK MSK, 
przyM. arytm. | nanta stand. 


Źródło: Obliczenia własne. 


SUMMARY 


The article adopts clearly distinguished notions of asymmetry and skewness. These are: 
A random variable has a skew distribution of probability if its average and dominant are not 
equal. 

A random variable X has a symmetric distribution of probability if there is such a point 'a' 
that for each value x of this variable the equality is fulfilled: 


P(X <a-x)=P(X >a+r) 


The definitions of skewness and symmetry of the distributions of a random variable are 
binding for the process of formulating the measures of skewness and asymmetry for the distributive 
sequences and specifically weighed which are presented in the article. The solutions are described 
which determine the measures of skewness concerning statistical distributive sequences with 
constant and changeable length of the intervals and the solutions for the specifically weighed 
sequences, when the differences between the consecutive values of the variable (z; — £c;_1) are 
constant or changeable. 

The measures of asymmetry presented in the article are standardized in the interval [0,1], and 
the measures of skewness are standardized in the interval [-1,1]. 


